КРАЋЕ РЕЧИ ЧЕШЋЕ

Зашто је контекст битан код дужине речи? Неуронаучници из Масачусетског института за технологију унапређују осамдесетак година стару језичку теорију харвардског лингвисте Џорџа Kингзлија Зипфа. Шта су установили?

 

Забрањена реч (Нексуском)

 

Упитате ли се понекад од чега се састоје речи? Шта реч чини речју, како се твори, какво јој је порекло или зашто је дугачка или кратка? Научници из Одсеку за неуро- и когнитивне науке Масачусетског института за технологију (МИТ) се питају. Стивен Пјантадози, Хари Тајли и Едвард Гибсон проучавају речи не би ли разумели како људи размишљају и комуницирају.

На пробу су ставили добро етаблирану, осамдесетак година стару језичку теорију и открили да има простора за побољшања. У питању је тзв. Зипфов закон, емпиријско научно начело које каже је дужина речи превасходно одређена учесталошћу њене употребе.

Примера ради, било би непрактично
замолити некога за вечером за чашу воде
ако би реч „вода” имала 15 гласова (слова).

Џорџ Kингзли Зипф, лингвиста с Унивезитета Харвард, устврдио је 1935. да „дужина речи, у целини, тежи да стоји у обрнутом, мада не обавезно пропорционалном, односу с бројем појављивања”. Другим речима, краће се речи користе више него дугачке. „Нашироко познато и очито универзално обележје људског језика јесте да су фреквентне речи обично краће”, саопштавају истраживачи у своме извештају. Примећују да се краће речи користе да би комуникација била ефикаснија него што би то био случај с честом употребом дужих речи.

Поменути Зипф претпоставио је да је то услед притиска који намеће комуникативна учинковитост. Примера ради, било би непрактично замолити некога за вечером за чашу воде ако би реч „вода” имала 15 гласова (слова).

 

Предвидљивост важнија

У „Стандардном корпусу савременог америчког енлеског” Универзитета Браун, који се састоји од два милиона речи текста, реч of је четврта по учесталости употребе. Члан the се у писању користи више него иједна друга реч енглеског језика. Наиме, списак од 100 најчешће коришћених речи садржи речи попут be, on, have, with, who и some, што су све врло кратке речи.

Претпоставка је била да би просечна
информација садржана у низовима од
две, три и четири речи делимично
требало да одреди дужину речи.

Ипак, когнитивни научници с МИТ-ија представили су суштинско побољшање Зипфовог закона. Показали су, ослањајучи се на десет језика, да је предвидљивост онога што кажемо важнија за дужину речи него то колико је често изговорамо. Циљ истраживања био је да се упореди Зипфова теорија о учесталости речи с теоријом о предвидљивости речи Пјантадозија и сарадника – идеја да просечна количина информација коју реч у контексту преноси – њена предвидљивост, одређује дужину речи.

Kористећи базу података на Интернету, истраживачи су проучавали колико се често сви могући низови од две, три или четири комбинације речи јављају заједно како би проценили колико је нека реч предвидљива кад је написана на уобичајен начин. Захваљујући овом сазнању, могли су утврдити јесу ли контекст и предвидљивост бољи предодређивачи (детерминанте) дужине речи од учесталости употребе.

На пример, у контексту типа „Вести у        ” реч „подне” врло је предвидљива и стога преноси веома мало информација. „Али у контексту као „Јео сам          ”, реч која недостаје веома је непредвидљива, али преноси много информација”, објашњава Пјантадози. Претпоставка је била да би просечна информација садржана у низовима од две, три и четири речи делимично требало да одреди дужину речи, било у словима или слоговима, будући да би се оптимални код тако понашао.

У претходном примеру, „подне” и речи које јој претходе показују тај учинак. „Једини начин да ови ефекти могу ући у лексикон јесте ако су наши језички системи и механизми језичке промене осетљиви на комуникативне притиске”, наставља Пјантадози.

Низови речи које људи користе кôдирани су – њихова слова, слогови, гласови и тако даље – за ефикасну комуникацију и бољи су за предвиђање дужине речи него сама фреквенција, истиче он. „То значи да низови речи обезбеђују ефикасне кôдове за значења која преносе, у односу на статистичке правилности у језику”, подсећа Пјантадози. „То је наша тврдња”.

 

Немачки изузетак

Love, amour, Liebe, amor и kärlek означавају исто у различитим језицима, а приближно су исте дужине, што се по Зипфу може очекивати уколико су слично предвидљиве или информативне. Али истраживачи с МИТ-ија наглашавају да заправо речи које претходе одређеној речи и следе је, а не њена дужина, одређују колико ће се често та реч користити.

Зашто су најчешће коришћене речи кратке?
Зато што теже да буду предвидљиве.

Истина, реч којом означавамо најјачу врсту наклоности јесте веома кратка, али колико је често људи изговарају, у којим околностима и колико је предвидљива пренесена информација када је изговоримо? I love you врло се разликује од I love chicken. За речи попут love контекст је битан.

Резултати истраживања вредели су за све проучаване језике (чешки, холандски, енглески, француски, италијански, португалски, румунски, шпански и шведски), осим једног – немачког. „Изненадило ме је да смо пронашли ефекте у толико много језика”, наглашава Пјантадози. „Мислио сам да би разлике у морфологији, или структури речи, могле затомити наше ефекте у многим језицима, али изгледа да то није случај.”

Због чега су речи које се најчешће користе кратке? Налази истраживања пружају и побољшано објашњење зашто су најчешће коришћене речи кратке – зато што теже да буду предвидљиве, што значи да многе кратке речи, у просеку, преносе релативно мало информација. Од 100 најфреквентнијих, многе су „функционалне речи” (на пример, с(а), од, преко), чија је главна сврха да повезују речи. Саме по себи, ове речи читатељу или слушатељу дају веома малу количину података.

Истраживачи су, такође, пронашли да се кратке речи морају наћи у паровима с другим познатим речима да би образовале контекст и пренеле информацију. То је због тога што су често речи које се појављују после добро познатих низова других речи, најпревидљивије и преносе најмање информација; на пример, „пуне руке посла” представља добро познату секвенцу речи и преноси мало информација. Али речи које имају мало везе с речима које им претходе садрже више информација, на пример, „пуне руке блата”.

Истраживање је открило да људи опште помоћу, бар, приближно оптималног кôда за значење, закључује Пјантадози. „Лексикони нису произвољни у смислу да су потпуно насумични. Напротив, добро су структурирани за комуникацију, с обзиром на обрасце низова речи које људи типично користе.”

Проблем традиционалног метода искључивог посматрања учесталости речи у томе је што обухвата једино бројање речи у изолацији не разматрајући редовну зависност међу речима.

 


 

Аутор: Стефан Вукашин

Извор:Нова Галаксија

 

Оставите одговор

Ваша адреса е-поште неће бити објављена.